課程資訊
課程名稱
統計與機器學習
Statistical and Machine Learning 
開課學期
109-2 
授課對象
公共衛生學院  流預所生物醫學統計組  
授課教師
王彥雯 
課號
EPM7012 
課程識別碼
849 M0960 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期三2,3,4(9:10~12:10) 
上課地點
公衛118 
備註
與蕭朱杏合授
限本系所學生(含輔系、雙修生)
總人數上限:30人
外系人數限制:2人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1092EPM7012_SML 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程將介紹常見的統計學習方法及相關理論,範圍將涵蓋監督式學習(supervised learning)、非監督式學習(unsupervised learning)、維度縮減(dimension reduction)、regularized regression、ensemble learning等,並搭配R或Python的操作,引入實際問題的處理與分析,培養學生從資料中了解問題,並擷取有用的資訊以解決實際問題的能力。 

課程目標
本課程將介紹常見的統計與機器學習方法及其理論,同時搭配實例分析與程式撰寫,期望學生修習完後能具備分析資料及正確解讀分析結果之能力。 
課程要求
修課學生必須具備統計學、迴歸分析之基礎。 
預期每週課後學習時數
 
Office Hours
另約時間 
指定閱讀
1. James, G., Witten, D., Hastie, T., and Tibshirani, R. (2013). An Introduction to Statistical Learning with Applications in R. Springer.
2. Hastie, T., Tibshirani, R. and Friedman, J. (2016). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd edition. Springer.
 
參考書目
1. Abu-Mostafa, Y. S., Magdon-Ismail, M. and Lin, H.-T. (2012). Learning from Data: a Short Course. AMLBook.
2. Alpaydin, E. (2014). Introduction to Machine Learning, 3rd edition. MIT Press Ltd.
3. Summa, M. G., Bottou, L., Goldfarb, B., Murtagh, F., Pardoux, C. and Touati, M. (2012). Statistical Learning and Data Science. Chapman and Hall/CRC.
4. Lantz, B. (2019). Machine Learning with R : Expert techniques for predictive modeling, 3rd edition. Packt Publishing.
5. Wickham, H. and Grolemund, G. (2017). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media.
6. Muller, A. C. and Guido, S. (2016). Introduction to Machine Learning with Python: A Guide for Data Scientists. O'Reilly Media.
7. 塚本邦尊、山田典一 、大澤文孝著,莊永裕譯 (2020)。東京大學資料科學家養成全書:使用 Python 動手學習資料分析。臉譜出版。 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
平時表現、課堂參與、作業練習 
40% 
 
2. 
期中報告或期中考 
25% 
 
3. 
期末口頭報告 
15% 
 
4. 
期末書面報告 
20% 
 
 
課程進度
週次
日期
單元主題
第1週
2/24  Introduction: what is statistical and machine learning? 
第2週
3/03  Overview of supervised learning (蕭朱杏老師) 
第3週
3/10  Data visualization (臺北大學統計學系 吳漢銘副教授) 
第4週
3/17  Regression: linear regression 
第5週
3/24  Regression: regularized regression -- ridge regression, LASSO, elastic-net 
第6週
3/31  Classification: logistic regression, k-nearest neighbors 
第7週
4/07  Classification: Bayesian decision theory, discriminant analysis 
第8週
4/14  Classification: support vector machines (I) 
第9週
4/21  Classification: support vector machines (II) & Support vector regression 
第10週
4/28  Tree-based methods -- regression trees, classification trees, random forests 
第11週
5/05  期中報告 
第12週
5/12  Model assessment: evaluation, cross-validation, bootstrap 
第13週
5/19  Ensemble learning: boosting, bagging, stacking, cascading 
第14週
5/26  Neural networks 
第15週
6/02  Other supervised learning methods 
第16週
6/09  期末口頭報告 
第17週
6/16  期末口頭報告 
第18週
6/23  期末考週